昆虫 学 报 4cta Entomologica Sinica, January 2010, 53(1): 9 - 19 ISSN 0454-6296 


Z A ft Ze RU E [AT BJ t E e. pl 0 REX BS n UU 


H B, 05 70A, 8 €, ATE 


(西南 大 学 看 学 与 系统 生物 学 研究 所 , 农业 部 乍 桑 学 重点 开放 实验 室 , 重庆 400716) 


摘要 : 神经 肽 (neuropeptide) 是 家 看 Bombyx mori 体内 重要 的 调控 物质 。 为 了 充分 理解 神经 肽 对 家 看 发 育 的 调控 , D 
充 家 春 神 经 肽 的 数量 , 本 人 研究 利用 BLAST 的 tblastn 程序 结合 OpenOffice 软件 的 查找 程序 , 基于 其 他 昆虫 和 无 状 椎 动 
物 神经 肽 的 同 源 性 和 保守 的 结构 特点 , 在 家 看 基因 、 理 论 蛋 日 质数 据 库 及 NCBI 中 进行 全 面 而 系统 的 基因 钥 查 ; 并 利 
用 各 种 在 线 工具 对 所 得 查 到 基因 和 理论 蛋 蝗 质 的 绪 构 和 成 熟 肽 进行 预测 分 析 。 结 末 共 获得 alatostatin-A ( AST- A), 
allatostatin-B ( AST-B ) allatostatin-C ( AST-C ) allatropin ( AT), ，ecdysis-triggering hormone ( ETH ), crustacean 
cardioactive peptide ( CCAP) fi] FMRFamide 等 31 个 神经 肽 基因 家 族 , 包括 37 个 神经 肽 基因 亚 家 族 , 共计 44 个 神经 肽 
基因 ; 预测 出 193 个 成 熟 的 神经 肽 , 其 中 73 个 根据 家 族 同 源 性 预测 在 C. 来 端 发 生 栈 胺 化 ,而 6 个 被 预测 在 N 末端 发 
生 了 环 化 , 9 个 被 预测 酷 氮 酸 发 生 了 硫酸 化 。 大 部 分 成 熟 神经 肽 都 具有 明显 的 家 族 结构 特征 , 但 proctolin, CCAP 及 
CAPA-PK 成 熟 肽 结构 上 与 其 他 昆虫 相 比 有 所 扩展 。 结 果 提 示 , 家 和 蛋 神 经 和 内 分 这 细 胞 产生 了 几乎 在 所 有 昆虫 中 具 
有 的 神经 肽 前 体 ; 进化 过 程 中 大 部 分 成 熟 神 经 肽 的 氨基 酸 序 列 在 种 间 产 生 了 差异 , 但 家 族 特征 性 基 序 高 度 保 守 。 本 
研究 为 神经 肽 功能 研究 以 及 神经 肽 对 家 乍 发 育 尤其 是 晴 期 发 育 调控 的 研究 葛 定 了 基础 。 
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Neuropeptide gene screening and mature peptide prediction in the silkworm, 


Bombyx mori 

GAN Ling, LIANG Jiu-Bo, LIU Xi-Long, HE Ning-Jia' (Key Sericulture Laboratory of the Ministry of 
Agriculture, Institute of Sericulture and Systems Biology, Southwest University, Chongqing 400716, China) 
Abstract: Neuropeptides play an important role of regulation for the silkworm, Bombyx mori. To fully 
comprehend the regulation of neuropeptides in the growth of B. mori and to get more neuropeptides in B. 
mori , the online program tblastn of BLAST and the search program of OpenOffice software were used to screen 
genes encoding putative neuropeptide precursors in the databases of silkworm genome and theoretical proteins 
based on the homology and the structure of the neuropeptides conserved in other insects and invertebrates. 
Several online programs were used to analyze the structures of the genes and the theoretical proteins to predict 
the mature peptides. As results, 31 neuropeptide gene families with 37 gene subfamilies including allatostatin- 
A ( AST-A), allatostatin-B. ( AST-B), allatostatin-C ( AST-C), allatropin ( AT), bombyxin, ecdysis- 
triggering hormone ( ETH) , crustacean cardioactive peptide ( CCAP) , and FMRFamide were identified. A 
total of 44 neuropeptide genes and 193 mature peptides were predicted. Among them, 73 neuropeptides are 
amidated at the C-terminal, six neuropeptides are cyclized at the N- terminal, and nine neuropeptides are 
sulfated. Most of the mature peptides share the similarity because they belong to the same family. But 
compared with that of other insects, mature peptides of proctolin, CCAP and CAPA-PK are more advanced in 
the structure. The results suggest that the neuropeptide precursors, which are possessed by almost all the 
insects, are produced by nerve and endocrine cells of B. mori, and in the course of evolution, differences in 
the amino acid sequences for most mature peptides formed among different insect species, but the motifs for 
the same family are highly conserved. This study provided useful information for future research on functions 


of neuropeptides, which will give us novel insights into the regulation of developmental process, especially at 
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the pupal stage, in the silkworm. 
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看 丝 业 起 源 于 中 国 , 历史 悠久 , 为 中 华 民族 文 
化 经 济 和 社会 发 展 作出 了 极为 重要 的 贡献 。 看 丝 业 
将 在 解决 “三 农 ” 问 题 , 特别 是 增加 农民 收入 、 调 整 
农村 产业 结构 上 发 挥 越 来 越 重 要 的 作用 。 家 看 是 由 
古代 妓 桑 看 驯化 而 成 的 绢 丝 昆 虫 。 由 于 人 们 有 目的 
地 长 期 选择 和 培育 , 使 看 体内 的 丝 脲 非常 发 达 ， 产 
丝 能 力 强 , 丝 质 也 好 。 家 看 是 完全 变态 的 昆虫, 在 
它 的 一 生 中 , 要 经 历 卵 .幼虫 - 晴 、 成 虫 ( 蛾 )4 个 在 
形态 和 功能 上 完全 不 同 的 发 育 阶段 。 人 研究 表明 昆虫 
神经 肽 (neuropeptide) 是 昆虫 体内 重要 的 调控 因素 ， 
是 昆虫 体内 最 大 量 和 最 多 样 化 的 信号 分 子 , 在 调控 
屁 虫 的 生长 发 育 、 采 食 、 繁殖 等 方面 起 着 关键 性 的 作 
用 ( Kastin, 2006), È E E AE K M tj Ak ( growth- 
blocking peptide, GBP) XERA H Eb rh E T E JFE 
的 研究 , 引起 了 科研 工作 者 的 关注 。 这 些 肽 分 子 通 
TE BT BUS E, 通过 在 特定 序列 处 的 酶 切 和 翻 
译 后 修饰 加 工 成 为 成 熟 的 具有 生物 活性 的 神经 肽 
(Kastin ，2006 ) 。 家 笃 中 分 刻 神 经 肽 的 需 官 主要 是 
脑 、 咽 下 神经 节 及 其 他 神经 广内 的 神经 分 泌 细 胞 。 
为 了 充分 理解 神经 肽 对 家 看 肾 期 的 发 育 调控 ,对 编 
码 神 经 肽 基因 的 租 查 是 必须 的 。 随 痢 不 同 昆虫 基因 
组 测序 计划 的 完成 和 公开 , 加 速 了 神经 肽 基因 的 发 
现 ( Coates et al., 2000; Hauser et al., 2008) ， 为 昆 
虫 的 发 育 ` 行 为 学 和 进化 关系 等 都 提供 了 重要 的 信 
B. EZRA, 前 人 的 研究 已 证 实 有 几 种 神经 肽 在 
家 乍 内分泌 机 制 或 生长 发 育 的 调控 上 起 重要 的 作 
用 , 如 促 前 胸腺 激素 (PTTH )、 羽 化 激素 (EH ) 等 ， 
但 仅 限 于 对 单个 神经 肽 基因 的 研究 。 由 于 生物 体 是 
一 个 复杂 的 网 络 , 任何 一 个 刺激 都 会 牵动 网 络 的 许 
多 环节 ， 只 对 少数 几 个 神经 肽 进行 研究 显然 是 不 够 
的 。 随 着 家 看 基因 组 计划 的 实施 和 人 完成, 一 个 庞大 
的 基因 数据 库 已 经 建成 。 本 研究 则 在 利用 已 知 的 屁 
虫 或 无 硝 椎 动物 神经 肽 基因 信息 和 家 春 的 基因 组 数 
据 库 、 蛋 白质 数据 库 , 通过 保守 基 序 得 查 家 乔 中 可 
能 存在 的 神经 肽 基因 ,并 进行 生物 信息 学 分 析 , 为 
家 鼻 神 经 肽 分 子 及 生物 学 功能 研究 以 及 神经 肽 在 发 
育 调控 中 的 重要 作用 及 机 制 研究 葛 定 基础 。 


1 材料 和 方法 


1.1 数据 库 搜索 
根据 在 其 他 昆虫 如 轩 腹 果 量 Drosophila 


melanogaster , [X] E, MV. T tx Anopheles gambiae, 意大利 
蜜蜂 Apis mellifera WERK Manduca sexta. 以 及 赤 
MEK Tribolium castaneum 55 Ze fh Eb, E A DERES 
物 中 已 经 研究 报道 的 神经 肽 保守 基 序 , 利用 BLAST 
的 tblastn 程序 , 结合 OpenOffice 软件 的 查找 程序 ， 
在 家 看 基因 组 数据 库 、 预 测 和 蛋白 质数 据 库 中 进行 全 
面 而 系统 的 第 查 。 特 别 是 利用 在 线程 序 tblastn 
( http://silkworm. swu. edu. cn/silksoft/blast2- 
simple. html) ( Altschul et al., 1997) 进行 神经 肽 基 
EX 8938 2€ ( blast score 范围 值 为 32 ~ 168 ; 本 地 blast 
搜索 , E 值 设 置 为 6E-004)， 并 利用 ExPASy- 
PROSITE ZX f£- ( http://www. expasy. org/prosite/ ) 
( Sigrist et al., 2002) ~ ClustalX1. 81 软件 、 NCBI 的 
psi-blast 程序 (http ://blast. nebi. nlm. nih. gov/Blast. 
cgi) ( Altschul et al., 1997) , MEME server ( http :// 
meme. sdsc. edu/meme/ ) 等 对 不 同 家 族 亚 家 族 理论 
神经 肽 前 体 全 序列 进行 比 对 分 析 。 
1.2 成 熟 肽 结构 的 预测 

利用 ExPASy 的 Translate tool ( http://www. 
expasy. ch/tools/dna. html) ( Gasteiger et al., 2003) 对 
fff 4-9] BJ R Zt CAE DS ETT ERR BITES UH TEZE 
软件 Signal P3. 0 的 Neural Networks 和 Hidden 
Markov Models 5$ 12; f£ Fr. (http://www. cbs. dtu. sk/ 
services/SignalP/ ) ( Bendtsen et al., 2004) 进行 神经 
肽 前 体 信 号 肽 的 预测 。 前 体 肽 的 切割 位 点 利用 预测 
工具 NeuroPred ( http ://neuroproteomices. scs. uiuc. 
edu/neuropred. html) ( Southey et al., 2006) 的 Known 
Motif 和 Insect Models 方法 并 结合 Veenstra( 2000) 提 
ES fei E DL 53 E AT eah T Z8 CB PAS JUL 
或 与 神经 肽 基因 家 族 已 知 成 熟 神 经 肽 的 同 源 性 进行 
预测 ; 使 用 在 线 软件 MAFFT 版 本 6 (http://align. 
bmr. kyushu-u. ak. jp/mafft/online/server/) ( Katoh 
and Toh, 2008 ) 对 推测 的 氨基 酸 进 行 序 列 比 对 ; 使 
用 在 线程 序 Sulfinator ( http://www. expasy. org/ 
tools/sulfinator) ( Monigatti et al., 2002) 结合 与 已 知 
方 肢 动 物 神经 肽 的 同 源 性 进行 栈 氨 酸 残 基 硫 酸化 状 
态 的 预测 ; N 末端 谷 须 酰胺 / 谷 须 酸 的 环 化 及 C 末 
问 甘 氮 酸 残 基 的 酰胺 化 等 根据 与 已 知 肽 亚 型 的 同 源 
性 进行 预测 。 


1 期 


2 结果 与 分 析 


2.1 家 看 神经 肽 基因 的 特点 


表 1 中 列 出 了 家 和 看 神经 肽 基因 得 查 的 结果 。 此 
外 本 研究 对 几 个 最 近 被 证 实 和 测序 但 不 知 其 前 体 的 
十 足 类 肽 也 进行 了 搜索 , BU HI/LGSI/LYRamide 和 - 


表 1 


H BE: 家 和 蛋 神 经 肽 基因 的 筛 奋 及 成 熟 肽 的 预测 11 


Ryamides( Stemmler et a1.,2007) , 但 在 家 看 中 没有 
找到 同 源 的 编码 基因 。 表 1 中 未 列 出 的 家 看 素 
(bombyxin) 是 结构 与 胰岛 素 ( insulin )/ 松 弛 素 
(relaxin) 相关 的 肽 , 在 家 和 看 基因 组 中 家 和 蛋 素 基因 有 
32 个 拷贝 , 根据 它们 序列 的 相似 性 被 划分 为 6 个 家 
族 ( Yoshida et al., 1998) 。 


得 查 到 的 家 乔 神 经 肽 基因 


Table 1 Neuropeptide genes in Bombyx mori 


神经 肽 家 族 亚 家 族 
Neuropeptide family Subfamily 
AKH 
Apis-ITG-like 
AST-A 
AST-B 
AST-C 
AT 
BMK5 
Bursicon Bursicon q 
Bursicon f 
CAPA 
CCAP 
CCHamide 
CHH CHH 
Corazonin 
DH Caleitonin-like 
Corticotropin-releasing 
factor-like 
EH 
ETH 
FMRFamide 
Myosuppressin 
FMRFamide-related peptide NPF 
sNPF 
Sulfakinin 
GBP 
GPA2 


GPBS 


基因 编号 
Number in database 


BGIBMCAO008722-TA 
BGIBMCAO008672-TA 
gi 195182593 


gi :193248555 
BGIBMGA014377-TA 


BGIBMGA009464-TA 


BGIBMGA005369-TA 
BGIBMGA011850-TA 
BGIBMGA008978-TA 


gi:62529358 
BGIBMCAO11086-TA 


gi 191175143 

gi 191175145 
BGIBMGA009606-TA 

gi 194072591 
BGIBMGA004168-TA 
BGIBMGA002280-TA 


BGIBMGAO011588-TA 


gi : 193248573 


gi 193248575 
gi 193248577 


BGIBMGA006291-TA 
BGIBMGA009728-TA 


BGIBMGA009271-TA 
BGIBMGAO10073-TA 


BGIBMGA009803-TA 
gi:191175137 
gi 40861544 
BGIBMGA012522-TA 
BGIBMGA013558-TA 


BGIBMGA014551-TA 
gi : 194072586 
BGIBMGA010342-TA 


基因 组 的 区 域 信号 上 肽 已 知 的 功能 
Genomic region Signal peptide Known functions 
Bm_nscaf2912 No 参与 幼虫 血液 碳水 化 合 物 
Bm nscaf2912 Yes 动态 平衡 的 控制 
Bm nscaf684 Yes 
Bm nscaf2623 Yes 
Bm. scaffold416 Yes 
Bm. nscaf2953 Yes 3p qn gr sy Je o, Rz 6$ EB fy, 
Bm nscaf2828 No 
Bm nscaf3031 Yes 
Bm nscaf2930 Yes 
Bm nscaf3015 Yes 人 参与 家 看 蕊 的 扩展 
Bm nscaf3015 Yes 
Bm nscaf2954 Yes 
Bm nscaf2954 Yes 
Bm nscaf2962 Yes 
Bm seaffold701 Yes 
Bm nscaf2770 Yes 
Bm nscaf2330 Yes 减少 纺 缘 率 ， 抑制 化 师 
Bm_nscaf3027 Yes 
Bm_nscaf2888 Yes 
Bm_nscaf2888 Yes 
Bm_nscaf2888 Yes 
Bm_nscaf2852 Yes 引发 赔 皮 或 羽化 
Bm nscaf2964 Yes 促进 晓 皮 激素 释放 
Bm nscaf2943 Yes FAI n Biy Hg Jj, JS Z E o 
Bm, nscaf2983 Yes 对 脏腑 肌 有 抑制 作用 ; 抑制 前 
胸腺 的 活性 
Bm_nscaf2964 Yes 
Bm_nscaf2852 Yes 
Bm_nscaf2852 Yes 
Bm_nscaf3048 No 
Bm_nscaf3078 Yes 
Bm_scaffold802 Yes 
Bm_nscaf2998 Yes 
Bm_nscaf2990 Yes 
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续 表 1 Table 1 continued 


神经 肽 家 族 亚 家 族 基因 编号 基因 组 的 区 域 信号 肽 已 知 的 功能 
Neuropeptide family Subfamily Number in database Genomic region Signal peptide Known functions 
IMFamide gi : 193248554 Bm_nscaf2964 Yes 
Kinin BGIBMGA010075-TA Bm nscaf2983 Yes 
Neuroparsin BGIBMGAO06409-TA . Bm nscaf2853 Yes 
NPLP1 BGIBMGAO09024-TA Bm nscaf2930 Yes 
Orcoknin BGIBMGAO05422-TA Bm nscaf2828 No 
PBAN BGIBMGAO01651-TA Bm nscaf2176 Yes RH SEE ET 
PDH gI:193248572 Bm. nscaf2859 Yes 
Proctolin BGIBMGAO08345-TA Bm nscaf2902 No 
PTTH BGIBMGAO000357-TA — Bm nscafl681 No ARESE RIT ATERT BURVESIIOU SZ ES 
SIFamide gi : 193248552 Bm_nscaf2964 Yes 
Tachykinin BGIBMGA010076-TA Bm nscaf2983 Yes 


AKH: 脂肪 动员 激素 Adipokinetic hormone; AST; 咽 侧 体 抑 制 素 Allatostatin; AT: 促 咽 侧 体 素 Allatotropin ; CAPA: 能 量 肽 Capability; CCAP; FB 
壳 类 刺激 心脏 肽 Crustacean cardioactive peptide; CHH: 甲壳 动物 高 血糖 激素 Crustacean hyperglycemic hormone; DH ( Cal-like) : 降 钙 素 样 利 尿 激 
素 Calcitonin-like diuretic hormone; DH ( Cor-releasing factor-like) : 促 肾 上 腺 皮质 激素 样 利 尿 激 素 Corticotropin-releasing factor-like diuretic 
hormone; EH; 羽化 激素 Eclosion hormone; ETH: Wi EIXO% Ecdysis-triggering hormone; GBP: 生长 抑制 肽 Growth-blocking peptide; GPA2 ; 93 
蛋白 激素 a2 Glycoprotein hormone alpha2; GPB5: 糖 蛋 白 激 素 B5 Glycoprotein hormone beta5; NPF: 神经 肽 耻 Neuropeptide F; NPLP1 : 神经 肽 样 
前 体 1 Neuropeptide like precursor 1; PBAN: 信息 素 生 物 合成 激活 肽 Pheromone biosynthesis activating neuropeptide; PDH: 色素 分 散 激素 Pigment 
dispersing hormone; PTTH: 促 前 胸腺 激素 Prothoracicotropic hormone; sNPF:; 短 神 经 肽 了 Short neuropeptide F. 表 2 同 The same for Table 2. XHP 
“基因 组 的 区 域 ” 中 的 Bm 代表 Bombyx mori Bm in the column of genomic region represents Bombyx mori ; 表 中 “信号 肽 ” 栏 中 的 “Yes ”表示 具有 信 
号 肽 ,“No” 表 示 没 有 预测 到 信号 肽 Yes and No mean with and without signal peptide, respectively. 表 中 的 “基因 编号 ” 栏 , 数据 库 是 指 家 看 基因 
组 数据 库 (http://silkworm. swu. edu. en/silk db/) $1 NCBI, 带 “gi” 的 编号 来 自 NCBI, 其 余 的 编号 来 自家 看 基因 组 数据 库 。Database means 
silkworm databank (http://silkworm. swu. edu. cn/silk db/) and NCBI. The numbers with gi are from NCBI, and the rest from silkworm databank. 


预测 的 神经 肽 前 体 序列 与 在 另外 的 昆虫 中 报道 
的 神经 肽 前 体 相 比较 表明 , 家 看 神经 和 内 分 洲 细 胞 
产生 了 几乎 所 有 昆虫 中 具有 的 前 体 神 经 肽 ,除了 加 
压 素 样 肽 ( vasopressin-like peptide ) 和 神经 肽 样 前 体 
2(neuropeptide-like precursor 2, NPLP2) , KAMA 
肽 基因 的 保守 性 主要 体现 在 以 下 几 个 方面 : C1) 9 
熟 肽 在 前 体 中 的 位 置 保守 。 大 部 分 神经 肽 前 体 都 具 
有 如 下 的 结构 特征 : 信号 肽 + 成熟 短 神经 肽 + (前 
体 相关 肽 )， 比 如 ETH; (2) 许 多 重复 的 具有 典型 家 
族 特征 的 成 熟 肽 序列 被 碱 其 切割 位 点 分 开 ， 如 
FMRFamide 相关 肽 、AST-B CAPA 家 族 和 等。 当然 在 
不 同 昆 虫 的 同 源 物 中 , 重复 数 是 不 相同 的 ; (3 ) 基 
E BS XC RETE BI BEBE EET HU, 在 家 和 在 中 如 DH 基 
转录 后 的 选择 性 剪接 在 另外 的 昆虫 中 也 存在 相同 
方式 (Dai et al., 2007) 。 
2.2 成 熟 神经 肽 的 预测 

肽 构成 多 细胞 生物 体内 最 大 和 最 多 样 化 的 信和 号 
分 子 。 这 些 分 子 通 常 来 日 于 更 大 的 和 蛋白质, 即 肽 前 
HR EJ, 通过 在 特定 序列 的 酶 切 加 工 后 , 许多 肽 经 
历 广 泛 的 翻译 后 修饰 ， 再 形成 其 成 熟 的 .具有 生物 
学 活性 的 构 型 。 神 经 肽 前 体 的 生物 激活 被 几 个 不 同 
的 机 制 产生 ， 如 在 成 对 的 碱 性 氨基 酸 处 切割 成 更 小 


的 肽 ; 在 捧 基 给 酰胺 化 ,天 冬 酰 胺 糖 基 化 ， 栈 氨 酸 
残 基 硫酸 化 ,以 及 谷 氨 酰胺 环 化 形成 焦 谷 氨 酸 
( Eipper et al., 1986) 。 这 些 过 程 对 保证 成 熟 肽 的 生 
物 学 活性 和 稳定 性 具有 重要 的 作用 。 

以 B 型 咽 侧 体 抑 制 素 (allatostatin-B，AST-B ) 为 
例 , 前 述 神经 肽 基因 的 搜索 及 成 熟 肽 的 预测 过 程 ( 图 
1) 。 利 用 有 果 蝇 的 B 型 咽 侧 体 抑 制 素 前 体 肽 (CenBank 
NP-048971 ) 进行 搜索 家 看 
BGIBMGAO09464-TA 基因 (blast score; 69; E-value; 8e- 
13) 为 假定 的 编码 B 型 咽 侧 体 抑 制 素 神经 肽 前 体 基因 。 
其 编码 的 理论 蛋 晶 BCIBMCA009464-PA 为 假定 的 B 型 
咽 侧 体 抑制 素 神 经 肽 前 体 (图 1)。Signal P3. O 的 
Neural Networks 和 Hidden Markov Models 算法 程序 预 
测 表 明 这 个 前 体 肽 序列 前 19 个 氨基 酸 作 为 信号 肽 , 信 
号 肽 酶 在 Ala 和 Ala 之 间 进 行 酶 切 处 理 , 剩 下 的 序列 
包含 了 17 个 Lys-Arg 和 Lys-Lys 的 二 碱 基 酶 切 加 工 位 
点 , 其 中 了 个 位 点 之 前 有 1 个 Gly 残 基 , RH TAHA 
切 制 产 物 C 末端 的 酰胺 化 。 除 了 信号 肽 序列 外 ,预测 
出 18 个 假定 的 肽 , 其 中 有 12 个 符合 B 型 咽 侧 体 抑 制 
素 家 族 C 末端 保守 基 序 的 绊 构 WX6Wamide(X 表示 在 
两 个 Tp 5X 3k B] BS 6 4 np 4B £4 3E BP). Bl 
AWQDMSSA Wamide , AWQDLNSAWamide, GWQDLNS 


accession no.: 
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AWamide, AWQDLNSAWamide, GWQDLNSAWamide, ^  AEEPHHDAAPQPYKTSICALRSAVLPH , PDKCSTNSYK 
SWQDLNSV Wamide , AWQDLNSAWamide , AWQDLNS TRFPVTGSNNHTLNTDNEVDLTEDD , AWSSLHSGWA , 
AWamide, GWNDMSSAWamide, AWQDLNSAWamide, ^ DDEAME, PVKPMFNNGGY , SSIEPDY ‚som EFIDAVE 
AWSALHGTWamide fN AWQDMSSAWGKQAPEKWAAF | QLVPYQQVPNEEHIDAPE 为 B 型 咽 侧 体 抑制 素 前 体 相 


HCSWamide( 图 1 和 表 1)。 剩 下 的 6 个 肽 序列 , 即 KARI 和 表 1)。 


PROTEIN:BGIBMGA009464-PA 
MRWCLFALWVFGVATVVTAAEEPHHDAAPQPYKTSICALRSAVLPHKKPDKCSTNSYKTREPVTGSNNHTLNTDNEVDLTEDDKRAWSSL 
HSGWAKRAWQDMSSAWGKRAWQDLNSAWGKRGWQODLNSAWGKRAWQDLNSAWGKRGWQDLNSAWGKRDDDEAMEKKSWQDLNS 
VWGKRAWQDLNSAWGKRAWQDLNSAWGKRGWNDMSSAWGKRAWQDLNSAWGKRAWQDMSSAWGKQAPEKWAAFHGSWGKRSSI 
EPDYEEIDAVEQLVPYQQVPNEEHIDAPEKKAWSALHGTWGKRPVKPMENNGGY 


AEBEPHHDAAPQPYKTSICALRSAVLPHKKPDKCSTNSYKTREFPVTGSNNHTLNTDNEVDLTEDDKRAWSSLHSGWAKRAWQDMSSAWGK 
RAWQDLNSAWGKRGWQDLNSAWGKRAWODLNSAWGKRGWQDLNSAWGKRDDDEAMEKKSWQDLNSVWGKRAWOQDLNSAWGKRA 
WOQODLNSAWGKRGWNDMSSAWGKRAWQDLNSAWGKRAWODMSSAWGKQAPEKWAAFHGSWGKRSSIEPDYEEIDAVEQLVPYQQVPN 


EEHIDAPEKKAWSALHGTWGKRPVKPMENNGGY 


AEEPHHDAAPQPYKTSICALRSAVLPHKK PDKCSTNSYKTRFEPVTGSNNHTLNTDNEVDLTEDDKR AWSSLHSGWAKR 
AWODMSSAWGKRAWQDLNSAWGKR GWQDLNSAWGKR AWQDLNSAWGKR GWQDLNSAWGKR DDDEAMEKK SWQDLNSVWGKR 
AWQDLNSAWGKR  AWQDLNSAWGKR GWNDMSSAWGKR  AWQDLNSAWGKR  AWQDMSSAWGKQAPEKWAAFHGSWGKR 
SSIEPDYEEIDAVEQLVPYQQVPNEEHIDAPEKK AWSALHGTWGKR PVKPMENNGGY 


AEEPHHDAAPQPYKTSICALRSAVLPH; 

PDKCSTNSYKTRFPVTGSNNHTLNTDNEVDLTEDD; 

AWSSLHSGWA AWQDMSSAWG AWQDLNSAWG GWODLNSAWG AWQDLNSAWG GWQDLNSAWG DDDEAME SWQDLNSVWG 
AWODLNSAWG AWQDLNSAWG GWNDMSSAWG AWODLNSAWG AWQDMSSAWGKQAPEKWAAFHGSWG 
SSIEPDYEEIDAVEQLVPYQQVPNEEHIDAPE AWSALHGTWG 


PVKPMFENNGGY | 
AWQDMSSAWamide AWQDLNSAWamide GWQODLNSAWanmide AWQDLNSAWAamide GWQDLNSAWamide 
SWQDLNSVWamide AWQDLNSAWamide AWQDLNSAWAamide GWNDMSSAWAamide AWQDLNSAWamide 


AWQDMSSAWGKQAPEKWA AFHGSWamide 
SSIEPDYEEIDAVEQLVPYQQVPNEEHIDAPE AWSALHGTWamide 


SSIEPDY (sos;i5EEIDAVEQLVPYQQVPNEEHIDAPE | 
图 1 家 看 一 个 假定 的 B 型 咽 侧 体 抑制 素 (AST-B) 前 体 激 活 过 程 
Fig. 1 The precursor activation process of a putative B-type allatostatin ( AST-B) in Bombyx mori 
图 中 家 看 BGIBMGAO009464-TA 基因 编码 了 一 个 假定 的 前 体 A putative precursor is encoded by silkworm BGIBMGAO009464-TA 
gene in the figure. 前 体 假 定 的 信号 肽 序列 用 斜体 表示 The putative precursor signal peptide sequence is shown in italics. 图 2 [n] 
The same for Fig. 2. allatostatin-B ( AST-B) 前 体 假定 的 加 工 流 程 表 示 如 下 : 第 1 个 箭头 代表 信和 号 肽 酶 的 切割 ; 第 2 个 箭头 代 
表 假定 的 前 体 转 化 酶 的 切割 ; 第 3 个 箭头 代表 通过 羧 肽 酶 下 的 酶 切 加 工 , 假定 的 肽 序列 被 释放 ; 第 4 个 箭头 代表 肽 酰 甘氨酸 
o- 酰 胺 化 单 氧化 酶 对 C 末端 甘氨酸 残 基 的 酰胺 化 ; 第 5 个 箭头 代表 肽 序列 中 酷 氮 酸 残 基 的 硫酸 化 作用 。The processes of B- 


type allatostatins ( AST-B) are shown with arrows: the first arrow stands for the cutting of signal peptidase; the second stands for the 





cutting of the putative precursor invertase; the third stands for the release of the putative peptide sequence by carboxypeptidase E; the 
fourth stands for the amidation of peptidyl-glycine œ amidation monooxygenase to C-terminal glycine residues; and the fifth stands for 


the sulfation of the tyrosine residue in the peptide sequence. 
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其 余 的 神经 肽 前 体 用 相同 的 方法 和 思路 进行 预 
测 , 预测 出 的 成 熟 肽 见 表 2。 软 件 分 析 结 果 显 示 , 5 
个 神经 肽 基因 没有 预测 到 信号 肽 序列 , 暗示 这 些 基 
5' 末 端 不 完整 。 男 外 也 可 能 是 在 5' 末 端 到 第 一 
个 重 氨 酸 密码 子 之 间 有 一 段 测序 错误 , 因为 典型 的 
神经 肽 信号 序列 在 这 一 段 富 含 非 极 性 和 下 水 性 妥 基 
酸 残 基 。 序 列 的 错误 或 不 完整 可 能 导致 预测 的 成 熟 
肽 数量 减少 或 结构 不 准确 。 因 此 可 通过 与 家 族 其 他 
成 员 的 同 源 性 进行 比较 预测 。 

PROTEIN:BGIBMGA008722-PA 
MAEAQLTFTSSWGGKRAAIAGTVSCRNDESLASIYKLIQNEAEKLLLCQKP 
图 2 家 看 一 个 假定 的 AKH 前 体 成 熟 肽 的 预测 
Fig. 2 The prediction of a putative AKH precursor 


mature peptide in Bombyx mori 


尽管 信号 肽 预测 表明 BGIBMGAO008722-TA 编 
码 前 体 ( 图 2) 没 有 信和 号 肽 存在 , 但 所 有 已 知 的 AKH 
前 体 有 如 下 相似 的 结构 组 成 特点 : 信和 号 肽 ERES DI 
成 熟 肽 + 标准 的 酰胺 和 二 碱 基 切割 信和 号 (-GKR 或 
者 -CRR) + AKH 前 体 相 关 肽 (APRP)。 编 码 肽 
pOLNFSPGWamide 的 几 个 前 体 和 蛋白 通常 作为 AKH/ 
RPCH 家 族 。 所 有 的 AKHs 成 员 在 N 末端 谷 氮 酸 环 
化 形成 焦 谷 氨 酸 , 而 C 末端 酰胺 化 (Fermlund， 
1974) ,因此 可 以 推测 在 Ala4 与 GIn5 之 间 为 信号 
上 肽 酶 切割 位 点 ,预测 出 该 基因 编码 的 家 看 典 型 的 
AKH 成 熟 肽 为 pQLTFTSSWGamide, 前 体 相 关上 肽 结 
构 为 AAIAGTVSCRNDESLASIYKLIONEAEKLLLCOKP。 
2.3 神经 肽 的 结构 
2.3.1 神经 肽 结构 的 家 族 保守 性 : 许多 成 熟 神 经 
肽 都 具有 明显 的 家 族 结构 特征 , 这 些 结构 基 序 在 强 
的 进化 压力 下 高 度 保守 。 因 此 既 可 结合 同 源 性 比 对 
进行 神经 肽 基因 的 得 查 , 也 可 对 成 熟 肽 的 预测 结果 
进行 验证 。 预 测 结果 表明 ,大 部 分 神经 肽 基因 编码 
前 体 可 切割 成 具有 典型 家 族 特 征 的 家 族 神 经 肽 和 前 
体 相 关 肽 ( 表 2) ,其 中 73 个 根据 家 族 同 源 性 预测 
在 C 末 端 发 生 酰胺 化 , 而 6 个 被 预测 在 N 末端 发 生 
了 环 化 , 9 个 被 预测 在 酷 氨 酸 被 硫酸 化 。 由 此 可 见 
家 看 神经 肽 前 体 切割 , C 末端 发 生 酰 胺 化 是 最 普遍 
的 转录 后 修饰 方式 。 其 中 预测 得 到 3 个 具有 AKH/ 
RPCH 家 族 典 型 特征 的 成 熟 肽 结构 ， 即 
pQLTFTSSWGamide ( 7L HK )~ pOLTFTPGWGQamide 
( FAK) .pOITFSRDWSGamide ( T HK) 。 在 家 和 看 中 一 
个 与 烟草 天 蛾 AKH sí 4 OGH [fu] B JL HA 
pQLTFTSSWGamide 已 经 通过 化 学 的 方法 得 到 了 证 


实 (Ishizaki and Suzuki, 1992) 。SIFamide 是 一 个 高 
度 保守 的 昆虫 /甲壳 类 动物 神经 调节 肽 ， 拥 有 
XYRKPPFNGSIFamide 的 结构 , 位 点 1 处 的 X 是 一 
个 可 变 的 残 基 , 预测 得 到 的 家 乍 成 熟 肽 SIFamide 255 
构 为 TYRKPPFNCSIFamide, 与 该 家 族 成 员 相 比 , 仅 
在 第 一 个 氨基 酸 残 其 有 差异 。IMFamide 与 
SIFamide 前 体 同 源 性 非常 高 (39% 的 相同 性 ) EL 
位 于 同一 基因 组 nscaf2964 contig 中 。IMFamide 基 
因 与 SIFamide 基因 具有 相反 的 转录 方向 。 预 测 得 
到 家 看 的 A XA Hk 5 44 W 
pQTFQYSRGWTNamide, 5 && 5 M Æ Dj 3E wx 
Periplaneta americana 的 心 脂肪 体 分 离 得 到 的 
corazonin 结构 完全 相同 (Veenstra，1989 ) 。 昆 虫 甲 
完 类 高 血糖 激素 /昆虫 离子 转运 肽 (Crustacean 
hyperglycemic hormone, CHH/Zinsect ion transport 
peptide, ITP) 属于 肽 的 一 个 大 家 族 , 在 甲壳 动物 中 
的 生理 作用 是 显著 的 。 根 据 前 体 相关 肽 的 存在 与 
fe, 可 被 划分 为 两 个 亚 家 族 。 即 CHH ME ZO 
EMER (MH) MEZ. HFP CHH 亚 家 族 含有 
一 个 前 体 相 关 肽 , 而 MIH 亚 家 族 则 没有 。 本 研究 
对 该 家 族 基因 成 熟 肽 的 预测 结果 SFFTLECKGVFDA 
AIFARLDICDDCFNLFREPQLYTLCRAECFTTPYFKG 

CMESLYLYDEKEQIDOMIDFVamide 与 烟草 天 蛾 中 
描述 的 离子 转运 肽 SFFSLECKGV YDASIFARLDRVC 

DDCYNLFREPQLYTLCRAKCFTTPYFKGCMESLYLY 

DEKEQIDQMIDFVamide( Dai et al., 2007) 有 高 度 的 
EWE, 并 且 在 前 体 中 有 一 个 前 体 相 关 肽 , 是 一 个 
真正 的 CHH 亚 家 族 成 员 。 预 测 得 到 的 FMRFamide 
相关 肽 家 族 的 5 个 亚 家 族 成 员 具 有 保守 的 C 末端 
保守 的 结构 特征 和 酰胺 化 的 残 基 ( 表 2)。 在 烟草 天 
蛾 中 , 拥有 pQVRFRQCYFNPISCF 序列 的 肽 已 被 表 
明 具 有 强 的 咽 侧 体 活 性 抑制 作用 (Kramer et al., 
1991), Jb Jk, X 28 Dh JL fb Eb RK 5 
pQVRFRQCYFNPISCF 相关 的 肽 特征 也 得 到 了 描述 ， 
如 果 量 的 pOVRYRQCYFNPISCF ( Williamson et al., 
2001), 。 这 些 结果 已 形成 了 一 个 结构 相关 肽 家 族 ， 
共同 的 称 为 C 型 咽 侧 体 抑 制 素 (AST-C) 。 对 其 家 和 看 
C 型 咽 侧 体 抑 制 素 预测 结果 产生 的 
pQVRFRQCYFNPISCF 与 烟草 天 蛾 完全 相同 。 
NFDEIDRSGFGEN 肽 是 最 早 从 刺 业 小 龙虾 的 神经 系 
统 分 离 且 描述 其 特征 。 表 明 在 后 肠 具 有 刺激 肌肉 运 
动 的 作用 。 根 据 它 的 来 源 及 生物 学 活性 ,这 个 肽 被 
命名 为 orcoknin (Stangier et al., 1992) 。orcoknin 的 
另 一 个 亚 型 紧 接 着 在 大 量 的 十 足 类 及 几 种 昆虫 中 被 


corazonin 
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证 实 (Pascual et al., 2004), ， 因 此 把 N 末端 为 ”外 , 其 他 的 神经 肽 基因 也 通过 预测 得 到 了 具有 保守 
NFDEIDR 保守 基 序 的 肽 归 为 orcoknin 肽 家 族 。 预 ”家族 特征 的 成 熟 肽 。 综 上 所 述 , 尽管 在 昆虫 的 进化 
测 结果 表明 家 人 蛋 含 有 两 个 orcoknin 家 族 的 成 熟 肽 ， ”过 程 中 大 部 分 神经 肽 的 氨基 酸 序 列 在 种 间 产 生 了 差 
BU NFDEIDRSSLNTFV 和 NFDEIDRSSMPFPYAI, 此 $, 但 家 族 特征 性 基 序 高 度 保守 。 


表 2 预测 的 家 等 成 熟 神经 肽 


Table 2 Predicted mature neuropeptides in Bombyx mori 


神经 肽 家 族 ( 亚 家 族 ) 预测 的 成 熟 肽 的 结构 家 族 保守 基 序 
Family (subfamily) Predicted mature peptide structure Conservative motif 
AKH pQLTFTSSWGamide, pQLTFTPGWGQamide, pQITFSRDWSGamide pQX, Wamide 
AKH-PRP AAIAGTVSCRNDESLASIYKLIQNEAEKLLLCQKP , 


SEATDYRNDGCSSEDSVYTIYKLIKNEAEKFLACQS, HFVVSMQPHHSICSSGPRTQLGSR 


Apis-ITG-like WGGLFNRFSSDMLANLGYGRSPYRHYPYGOQVEPDEAYEALENNRISNVIDEPAHCYSSPCVTNGDC 
CGGLLCLETDDGGRCLSAFAGRKLGEICNRENQCDAGLICEEA APGEMHICRPPSTGRKQ Y 
NEDCTTSSECEITRGLCCIMQ, HRQKSRKSCGYFKEPLVCIGPV AIDOIREYVEHTTGE , ICAYRLH 


AST- A SPQYDFGLamide, LPVYNFGLamide, PYSFGLamide, ARMYSFGLamide, ARSYSFGLamide, -Y/FXFGLamide 
QRDMHRFSFGLamide, LSSKFNFGLamide 
AST-A-PRP SEDDTSENYIDA, AEQVAEHGAEQVAEHAAPLE, AYSYVSEY, FAEEPAED, 
AST-B AWQDMSSAWamide, AWQODLNSAWamide, GWQDLNSAWamide -WX Wamide 


AWQDLNSAWamide, GWQDLNSAWamide, SWQDLNSV Wamide 
AWQDLNSAWamide, AWQDLNSAWamide, GWNDMSSAWamide 
AWQDLNSAWamide, AWSALHGTWamide, AWQDMSSAWGKQAPEKW AAFHGSWamide 


AST-B-PRP AEEPHHDAAPOPYKTSICALRSAVLPH, PDKCSTNSYKTRFPVTGSNNHTLNTDNEVDLTEDD , AW 
SSLHSGWA , DDDEAME, PVKPMFNNGGY , SSIEPDY (934 EEIDAVEQLVPYQQVPNEEHIDAPE 


AST-C pQOVRFRQCYFNPISCF 
AST-C-PRP MNRVARSWPQATEPRGWAMRNVDGRLVRPWRAD * 
AT GFKNVEMMTARGFamide , GTPTFKSPSVGIARDFamide, GTFKPNSNILIARGYamide -ARXYamide 
AT-PRP APDGRLA, KQQRPT, DRSHTRAE, DVDHQRSSQRPS, TPEFENEGIWEADIDLPCV ALAIYTRLA , 


SGNDDYDEEEEIRVT, SILVESKLDFVRDWLSKPQTGPFEKSVSLCRYDIGYVHHPRMKFTPKIGLM 
VAHDFGamide, TNSQNEPVYGVNNYWDMLENAPEREGQEANDDKTLERKINDRTKVSFRQMFLA 
NYLLKNDNQNGHDIFFCHLVINYV 

BMK5 GSCGTKVGGAGAATKV VTKSGSamide, 
VSAVPTPSNNKDGSTISELPENWDQTKDDNRSLFLNKSDKNDLEPYPLALSEEGNQDGYDQTVDQR 
FDSPQSNGELDNLIMRPELYGEPPAMEGLASAFDLQ, NLKPEDQAALSPIDLMTQHEAQ, LIL, GSGTK 
VGGAAASAKTATKNSGGN, NFRPISE, DSGLSAADVRALLNLWEAQE, FMVA, KQEYANQFA 
ADRYYGRVNPDEEQPEV DENGDLWYNEPV VIGPHDRDYPHHSYFSEQNRMALARGYPDLYQVG 
PNELAQRYEEA, QYANKM, SDNMMHQNNYRPRDDLYTLAELLRSAPRVQEQOQDIPV Y 


Bursicon q FPVTGHEVQLPPGTKFFCOECQMTAVIHVLKHRGCKPKAIPSFACIGKCTSY VOVSGSKIWQMERTC 
NCCQESGEREATV VLFCPDAQNEE , FRKVSTKAPLOQCMCRPCGSIEESSIIPQEV AGYSEEGPLY NHFRKSL 


Bursicon B EENCETVASEVHVTKEEYDEMGRLLRSCSGEVSVNKCEGMCNSQVHPSISSPTGFQKECFCCREKF 
LRERLVTLTHCYDPDGIRFEDEENALMEVRLREPDECECYKCGDFSR 

CAPA-pvk KLRPDGVLNLYPFPRVamide, QLYAFPRVamide -PRVamide 

CAPA-pk GGPPSDRNEPHDDLLGLHLDDPGMWFGPRLamide, -PRLamide 
GGPPSDRNEPHDDLLGLHLDDPGMWFGPRLDVVNQNEDamide 

CAPA-PRP ASYRTWOIPINDVY (sos, LDY (sosm) EPVE, SEREQIDOIAHEERMK , SKLL, SLKNGDDDV 
VNQNEDamide 


CCAP PFCNAFTAVTVTRYSQSFSKNYLSIRRLRALTKPIKCFKHVLFYQGCamide PFCNAFTGCamide 
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续 表 2 Table 2 continued 


神经 肽 家 族 ( 亚 家 族 ) 


Family (subfamily ) 


CCAP-PRP 
CCHamide 
CCHamide-PRP 


CHH 


CHH-PRP 
Corazonin 


Corazonin-PRP 
DH( Cal-like) 
DH( Cal-like) -PRP 


DH( Cor-releasing 
factor-like ) 


DH( Cor-releasing 
factor-like ) -PRP 


EH 
ETH 
PETH 
ETH-PRP 
FMRFamide 


FMRFamid-PRP 


GBP 


GPA2 


GPB5 


IMFamide 
IMFamide-PRP 
Kinin 


Kinin-PRP 


Myosuppressin 
Myosuppressin-PRP 


Neuroparsin 


家 族 保守 基 序 


Conservative motif 


预测 的 成 熟 肽 的 结构 


Predicted mature peptide structure 


KOKEFYNSQ, ATIPRNFDPRSNEEMVTMP, 
SOTAPGMPNQDLMRQRQYVDEDTLGTMLDSESAIDELSRQILSEAKLWEAIQEASAEIA 


GCSAFGHSCFGGHamide 
SQNTNDEY ( stos) FLETI, SGEPAPMDMANQDMMVRHQLGQEETPPHPGYPHSSYNVLQPGD 
DIIPIRDGGVYDHDAAARDVMKYKLRNIFKHWMDNY 


SFFTLECKGVFDAAIFARLDICDDCFNLFREPOLYTLCRAECFTTPYFKGCMESLYLYDEKEQID 


QMIDFVamide 

LPSSAPHHVE 

pQTFQYSRGWTNamide 

YKGERNHELFDVFQ, DGH, DELRDEVLERILTPCQLDKLKY VLEGKPLNDRLFVPCDYIEE 
EVNQP 

AFDLGLGRGYSGALQAKHLMGLA AANFAGGPamide 

NAQ, YPSINDYYRDDGQYDPDEIIDMLGRLGNLIQMERKMQNE 


CX, GHXCXGXHamide 


pQTFQYSRGWTNamide 


MPSLSIDMPMSVLRQKLSLENERKLQSLRAMANRNFLNDlIamide, 
SFSVNPAVDTLQRGAYNHFLEKV VOSNRDYLNRIamide, 
KMPSLSINNPMEVLRQRLLLEV ARKQMREANQRQAV ANRLFLQNV amide 


IDLMQMDPSLADDESLGFAMQSLSGRY AAAPWLYLLADVSHDPQNGSDRVK, GFHWAPSAKAAKFY, 
IDLMQMDPSLADDESLGFAMQSLSGRY AAAPWLYLLADVSHDPQVRSEMQARS, DSWKILTEN, IDLMQ 


MDPSLADDESLGFAMQSLSGRYAAAPWLYLLADVSHDPORMAEFSQSSCGRARP, GAWGEPASYLYNN 
MFGPWFEGSLCAESCIKARGKDIPECESFASISPFLNKL, SPAIASSYDAMEICIENCAQC 
SNEAFDEDVMGYVIKSNKNIPRMamide -PRXamide 
SFIKPNNVPRVamide -PRXamide 
NYDSGNHFDIPKV YSLPFEFYGDNEKSLNNDDAEEY YAKKMGSM 
SAIDRSMIRFamide, SASFVRFamide, DPSFIRFamide, HRARNHFIRLamide -RXamide 
SPDLEA, STLPVVPPAQPSFLORYSASQPAALTADDLMTFLRAYEEDYSSPVS, 

SVDEENSGYQAETNTYPQ, SVVDPCNDCA, DNELSESNDEDRY (59, EVESERT 


GVNGFFNDLRRGISQVEEDLSDRLIFRDDDNDQYNYNNAVNRPVYPTESVSSGSVORGVVEFVTOQ 
PTIVPTPTSAGKTTTEKEGRENFVGGCATGFTADGRCKPTF 


HPVTSLGQCCNIMEAEDVPVKVLCLDGERNLIFKSAVSCACYHCOQKE, 
AESWRKPGCHRIGHTRNISIPDCVEFKITTNACRGYCESWSLPSIMLGF 


CWDDVKIVSCWGYCLSYEVCSSEDTSCEWLPPDSSLLGGLILKEELEEELE , 
FFCVDASMSVRCKL, HSHKVMQTDLNS 


NYKNAPMNGIMFamide 
GPTDYDSRSKTFTALCEIATEACQAWFPTQEN 


NFSPWGamide, VRFSPWGamide, KVKFSAWGamide -FX1X2WGamide 


FPLKMMALSAKFDPRSFKEAMPFKTFVESLPKVFKPGOPYYDVNIKKDamide, 
SPPIIGPIWIPAPENVKDSTLDTIILIRNSPDKDEAIKTV ; DKPSFEHMWTW ; SSSVREPSMP, 
QYINTGGPGADTILDPLDSSLQYSLPY ANYFNVPDAOMDPDTSDGOQYGIVHDGGVQ, 
TADDKEQVRD, WLPNLADIDKTMYIKNNEVATPFLVGFSGNSDENDTALLDQVD; 
SGQMVYKPGSKSSKLIFSATVPELEKIVSNYLPSGERLNLAGLHYIPSVD 


pQDVVHSFLRFamide -HVFLRFamide 


APAQLCAAAAENDPRATRFCQALNTFIELYAEAAGEQVPEYOQALIRDYPQLLDTGM 
WDCVCNPRECEVLEPSGCPGLGIV VWDSCRCCKVCARTLGENCGGFSGTCEPGLKCYEGSCTQIT 
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续 表 2 Table 2 continued 


神经 肽 家 族 ( 亚 家 族 ) 预测 的 成 熟 肽 的 结构 家 族 保守 基 序 


Family (subfamily ) Predicted mature peptide structure Conservative motif 
NPF PERFDTAEQISNYLKELQEYYSVHGRGRY mide, -RXRXamide 


REEGPNNVAEALRILQLLDNYYTQAARPRFamide, 
DVDAAGDRVDPELLDRAVRLLWLEKLDRIYSYHTRPRFamide 


NPF-PRP FGYK; QYPRP; QMHIADASVIFRESPFFEHSLNEDGLL; SDTYTNWAKDVEKPDLPTWLTYA ; 
REEGPNNVAEALRILQLLDNYYTQAARPRID; SDTYTNWAKDVEKPDLPTWLTY A 


NPLP1 NIQALARDGYRMamide, PNFIDAFTKNRWQPITKESPKFYYFRSLKIPLHSSamide, 
HIGSLAREYFAAPEVDSAVNSDDADV AVPPHSHPTGRILHRPLSNDLPNTNPSLPAPPISP, 
KNQ, LPTEPENQWPTFP, NIATLAKNGYLRNSGANSY, 
SISILAKNGMLPTYRSPYVGTDKQEHEDESQE, NLASIARLRSYSAM , GOYNTQNN 


Orcoknin NFDEIDRSSLNTFV , NFDEIDRSSMPFPYAI NFDEIDR 


Orcoknin-PRP DPHQEQDVSGNDHTSGERYDA AGHKTRNLDPLGGGNLVRDVREARHSGYLPYQMF, YDYISPYamide, 
EPWPLVPAEYGGYYGDGFP, FYHLSSFD, YRPDYPMDEIDLSHFPVGS, SQDSY (sosm) PLASNL 


PBAN TDMKDESDRGAHSERGALWFGPRLamide, IIFTPKLGRSVAKPQTHESLEFIPRLamide, XPRL/UN mide 
LSEDMPATPADQEMYQPDPEEMESRTRYFSPRLamide , TMSFSPRLamide 
PBAN-PRP ELSYGMFNVLGTFAVRP, SMKPSTEDNRQTFLRLLEAADALKFYYDQLPYERQADEPETKVT 
PDH NADLINSLLALPKDMNDAamide 
PDH-PRP VANSEAKIKLNRKVSESSYGSDEQYIRQIHSLVNAYREDNSMLGENFIIETK ALIDTK YRTW 
Proctolin QGSDDETGCIRLLVCKITPFIVRMQEA VFGNNGRNDKTKSKGNEQQRNGV ASVMYRYLPT -RYLPT 
Proctolin-PRP HRDCSIE, QDEINEHSDICE, MTWILNKNSRKLQEMISAAKNESLPDNIEHLI * 
PTTH PDVGGFMVEDQRTHKSHNYMM, 
ARNDVLGDKENVRPNPYYTEPFDPDTSPEELSALIVDY ANMIRNDVILLDNSVETRT, 
GNIQVENQAIPDPPCTCKYKKEIEDLGENSVPRFIETRNCNKTQQPTCRPPYICKESLYSITIL, 
ETKSQESLEIPNELKYRWYV AESHPVSV ACLCTRDYQLRYNNN 
SIFamide TYRKPPFNGSlFamide XYRKPPFNGSlFamide 
SIFamide-PRP NNVENDSSGRAIAALCEITTETCQAWYQALESQ 
sNPF SVRSPSRRLRFamide, SDPDMPPQAPIDEMDELLSLREVRTPVRLRFamide, -RXRFamide 
SDERAVPHIFPQEEQDRAVRAPSMRLRFamide 
sNPF-PRP QALSNYDASPATFESRNNWDALGGLY ALLAQHDALGGHALA , SDNNMFLMPYESALPKEVK 
ASGSVEDDRQQE 
Sulfakinin GDDTFDDY so, GHLRFamide -Y (sou; GHM/LRFamide. 
Sulfakinin-PRP SDD, ANL, IQPDDDEDFRPHPLY (sosu) RDYGLIRSRVI 
Tachykinin IPQGFLGMRamide, KPQFFVGVKamide, APLGFTGVRamide, -FXGXRamide 


AANMHQFYGVRamide, PYDLSIRGKFIGVRamide, GQMGFFGMRamide 


Tachykinin-PRP WIDGMNDPRY, QEMI, HEDDSSEQYY, EDMSSEY soi; QY (sos) Y (sog; PYEAL, 


DGSLIGQIEYTSAEHINDGQYPILNDILNEYLQKLERQETNSDTNETEEQRITNEVE , 
SVDN, DVKNSNGKEIKFLLSRPFP,, NFY (so; DY sosm LENPDGY sosm) F 


PRP: 前 体 相 关 肽 Precursor-related peptide; CAPA-PVK: 能 量 肽 pvk Capability-periviscerokinin ; CAPA-PK: 能 量 肽 pk Capability-pyrokinin; * X 
示 由 于 信号 肽 缺失 ,预测 受到 影响 的 成 熟 肽 结构 ; X 代表 可 变 的 氨基 酸 残 基 , 其 后 的 数字 代表 不 同 的 变量 , 其 下 标的 数字 代表 间隔 的 氨基 酸 
残 基数 。 氨 基 酸 字母 右 下 标的 -(SO3H) -代表 酷 氨 酸 残 基 硫 酸化 状态 (S03H) ; N 末端 小 写字 母 p RRRA ARIM; C 末端 -amide 
代表 甘氨酸 残 基 的 酰胺 化 。Asterisk indicates the affected prediction of the mature peptide structure due to the missing signal peptide; X stands for the 
variable amino acid residues, and the subsequent figures represent the different variables. The footnote figures represent the number of the interval amino 
acid residue. The right footnote of amino acid refers to the state of tyrosine sulfate residue. The N-terminal letter p represents the cyclization of glutamine/ 


glutamate. C-terminal-amide represents the amidation of glycine residues. 
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2.3.2 神经 肽 结构 的 扩展 性 : 预测 结果 表明 家 看 
部 分 神经 肽 结构 存在 扩展 现象 。Proctolin 是 一 个 五 
HK, BB RYLPT, RFX BT TEM SEN Periplaneta 
americana (Starratt and Brown, 1975) 的 描述 , 在 大 
量 的 昆虫 和 十 足 甲 元 类 上 已 经 证 实 了 它 的 结构 和 功 
能 。proctolin 主要 作为 神经 调 质 起 作用 (Isaac et 
al., 2004), {E Hj Œ i TR. HR proctolin 的 前 体 肽 
( GenBank accession no: CAD30643) 并 结合 
openoffice 软件 的 查找 程序 在 家 看 理论 重 日 质数 据 
库 中 进行 搜索 ，BGIBMGA008345-TA 为 假定 的 编码 
含有 proctolin 的 前 体 基因 。 但 对 其 前 体 预测 的 成 熟 
肽 结构 为 QGSDDETGCIRLLVCKITPFIVRMQEAVFG 
NNGRNDKTKSKGNEQQRNGVASVMYRYLPT, 5 另 
外 同 源 的 成 熟 亚 型 比较 表明 proctolin N 端 存在 扩展 
现象 (图 3: A) , 这 种 扩展 现象 在 桃 蚜 Myzus persicae 
中 也 有 报道 (Christie et al., 2008) 。 此 处， 含有 


A 


ZÆ Bombyx 


B 。 烟草 天 蛾 Manduca PFCNAFT-------- 
Hi t Drosophila PFCNAFT —--- 
家 看 Bombyx 

"S 

C 家 大 Bombyx CAPA-a 


家 看 Bombyx CAPA-b 


JEUNE Periplaneta ------------------------------------------ 


PFCNAFTGCamide 结构 的 肽 最 早 从 普通 滨 蟹 
Carcinus maenas 的 神经 系统 中 分 离 得 到 证 实 , 表明 
具有 作用 于 心脏 的 作用 , 因此 被 命名 为 作用 于 心脏 
的 肽 或 CCAP( Stangier et al., 1987) 。 利 用 烟草 天 蛾 
的 CCAP 前 体 肽 (GenBank accession no; AAL39064) 
进行 搜索 ，BCIBMCA009606-TA 被 证 实 为 假定 的 编 
人 码 CCAP 的 神经 肽 前 体 基 因 (blast score; 149; E- 
value; 5e-37) 。 对 其 前 体 预 测 结 果 产 生 的 该 家 族 成 
熟 肽 结构 PFCNAFTAVTVTRYSQSFSKNYLSIRRLRA 
LTKPIKCFKHVLFYQGCamide £1 -5 R iH. 4H] E R R 
的 CCAP THEE, 在 成 熟 肽 的 中 部 存在 扩展 现象 (图 
3: B), CAPA 基因 表达 时 进行 了 选择 性 剪接 , 对 前 
接 产 物 CAPA-a 和 CAPA-b 成 熟 肽 的 预测 表明 
CAPA-b 的 成 熟 肽 之 一 CAPA-PK 与 CAPA-a 的 成 就 
肽 之 一 CAPA-PK 相 比 也 有 所 扩展 (图 3: C). 


QGSDDETGCIRLLVCKITPFIVRMQEAVFGNNGRNDKTKSKGNEQORNGVASVMYRYLPT 


zk k k k k 


PFCNAFTAVTVTRYSQSFSKNYLSIRRLRALTKPIKCFKHVLFYQGC-NH; 


xk 


HLDDPGMWFGPRL------------------- NH» 
HLDDPGMWFGPRLDVVNQNED-NH, 


tok ck ck ck ck ck ck ck ck ck ck 


图 3 家 看 成 熟 神经 肽 结构 的 扩展 性 
Fig. 3 Structure extensibility of mature neuropeptides in Bombyx mori 
A; Proctolin; B; CCAP; C; CAPA-PK. * 代表 序列 相同 ; -NH, 代表 C 末端 酰胺 化 。Asterisk represents sequence identity; -NH, represents the 


amidation of glycine residues in the figure. 
Mb NA. 
3 讨论 


分 离 纯化 相应 的 神经 肽 是 至 今 为 止 的 主要 方 
法 。 但 基于 取材 和 研究 方法 的 难度 , 对 神经 肽 的 发 
现 和 研究 进展 较 慢 , 且 痢 限于 对 单个 神经 肽 或 基因 
的 研究 。 随 着 家 看 基因 组 测序 的 完成 , 理论 重 日 质 
数据 库 的 建立 ,以 及 生物 信息 分 析 技 术 突 飞 猛 进 地 
发 展 , 为 神经 肽 基因 快速 租 查 更 定 了 民 好 的 基础 。 
本 研究 利用 已 研究 报道 的 昆虫 神经 肽 与 家 看 神经 肽 
之 间 的 同 源 性 对 家 乍 基因 数据 库 进 行 了 全 面 而 系统 
的 神经 肽 基因 得 碍 和 成 熟 肽 的 预测 ， 共 获得 31 个 


神经 肽 基因 家 族 , 具体 为 37 个 神经 肽 基因 亚 家 族 ， 
以 及 44 个 神经 肽 基因 , 并 通过 软件 分 析 结 合 与 已 
知 昆 虫 或 无 痛 椎 动物 神经 肽 的 同 源 性 ,预测 出 193 
FRAKAZAR, MERRIER, KAH 
经 肽 前 体 通常 由 90 ~ 250 个 氨基 酸 残 基 组 成 , 成熟 
神经 肽 的 大 小 通常 为 3 ~ 50 个 氨基 酸 , 与 其 他 昆虫 
上 的 相关 报 起 基本 一 致 。 对 于 本 研究 中 多 个 预测 的 
成 熟 神经 肽 序列 长 达 70 个 氨基 酸 , 甚至 100 多 个 
氨基 酸 则 需要 进一步 用 实验 进行 验证 。 神 经 肽 基因 
在 高 度 保留 家 族 的 保守 性 特征 序列 的 同时 , 在 昆虫 
进化 的 过 程 中 也 进行 了 结构 上 的 扩展 。 本 项 研究 结 
果 极 大 地 扩充 了 家 和 蛋 神 经 肽 的 容量 ， 为 神经 肽 的 功 
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能 研究 左 定 了 基础 。 

神经 肽 前 体 的 加 工 是 一 个 复杂 的 过 程 , 包括 多 
种 翻译 后 的 修饰 方式 。 但 预测 得 到 的 成 熟 肽 的 质 蓓 
比 一 方面 可 为 质谱 研究 提供 数据 支持 , 尤其 是 使 用 
个 别 神经 系统 进行 直接 的 MAL-DI-FTMS, 可 以 评定 
预测 的 结构 是 否 正确 , 同时 也 能 发 现 一 些 非典 型 性 
的 神经 肽 前 体 加 工 方式 。 另 外 本 研究 只 能 盘查 到 在 
昆虫 或 无 峭 椎 动物 中 已 经 研究 报道 过 的 神经 上 肽 同 源 
TJ, 而 对 于 尚未 人 研究 发 现 的 家 看 中 的 神经 肽 或 家 族 
仍 需 进一步 展开 人 研究。 
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